AI资讯新闻榜单内容搜索- LLM

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索:  LLM
图灵奖得主Sutton新作:AI的下一步,是走向「生成认知」

图灵奖得主Sutton新作:AI的下一步,是走向「生成认知」

图灵奖得主Sutton新作:AI的下一步,是走向「生成认知」

从 LLM 的超长文本处理、视频生成模型的以假乱真、Agent 自主规划与执行的日趋成熟,到 VLA、世界模型等开始进入物理世界,AI 正在不断拓宽其能力边界。

来自主题: AI技术研报
6335 点击    2026-06-02 15:05
Speech LLM 的下一个突破口:你的语音大模型可以是个「带韵律的文本模型」

Speech LLM 的下一个突破口:你的语音大模型可以是个「带韵律的文本模型」

Speech LLM 的下一个突破口:你的语音大模型可以是个「带韵律的文本模型」

相信大家都有过这样的体验:同一个系列的模型,使用文本交互的时候,模型就像开启了 “最强大脑”,数学代码等各种复杂推理任务样样精通,可是一旦将其改造成语音对话模型之后,性能就猛烈下降,严重 “降智”,经常会犯很多基本的逻辑错误。

来自主题: AI技术研报
5878 点击    2026-05-28 14:51
告别多奖励跷跷板:Flow-OPD将多教师OPD带入图像生成

告别多奖励跷跷板:Flow-OPD将多教师OPD带入图像生成

告别多奖励跷跷板:Flow-OPD将多教师OPD带入图像生成

今年以来,在线策略蒸馏 OPD(On-Policy Distillation)已经逐渐成为大厂 LLM 后训练中的重要组件,例如 DeepSeek-V4,GLM5 就使用了多教师 OPD 来整合不同领域专家模型的能力,相比混合奖励强化学习收敛更快、效果更好。

来自主题: AI技术研报
6915 点击    2026-05-26 10:07
突发: Karpathy 加入 Anthropic

突发: Karpathy 加入 Anthropic

突发: Karpathy 加入 Anthropic

5 月 19 日,Andrej Karpathy 在 X 上宣布加入 Anthropic。个人近况:我已加入 Anthropic。我认为未来几年在 LLMs 前沿的工作将具有特别重要的塑造性。我非常激动能加入这里的团队并重回研发。我仍然对教育充满热情,并计划适时恢复我在这方面的工作

来自主题: AI资讯
9640 点击    2026-05-20 00:05
LLM助力突破尘封60年数学猜想!北大王立威团队大幅刷新斯坦纳比下界

LLM助力突破尘封60年数学猜想!北大王立威团队大幅刷新斯坦纳比下界

LLM助力突破尘封60年数学猜想!北大王立威团队大幅刷新斯坦纳比下界

近期,LLM 已经在 IMO 上取得了很好的成绩,在一些研究级数学上(如短程证明、组合构造)也有所进展。但如果真正让 LLM 去处理提出数十年的数学猜想,结果会是如何?

来自主题: AI技术研报
5437 点击    2026-05-18 15:29
ICML 2026 Spotlight| 拒绝盲目猜token,阿里x浙大将投机解码带入弹性预算时代

ICML 2026 Spotlight| 拒绝盲目猜token,阿里x浙大将投机解码带入弹性预算时代

ICML 2026 Spotlight| 拒绝盲目猜token,阿里x浙大将投机解码带入弹性预算时代

随着大模型参数规模持续扩大,推理成本已经成为生产级 LLM 服务的核心瓶颈。投机解码(Speculative Decoding, SD)通过「小模型 draft + 大模型 verify」的方式,将多个候选 token 放到一次目标模型前向中并行验证,从而缓解自回归解码的串行瓶颈。

来自主题: AI技术研报
8159 点击    2026-05-13 15:01
ICML 2026 | 大模型内部也会长出「情绪树」,规模越大越懂人心

ICML 2026 | 大模型内部也会长出「情绪树」,规模越大越懂人心

ICML 2026 | 大模型内部也会长出「情绪树」,规模越大越懂人心

随着语音、视频、多模态能力不断融入大语言模型(LLM),人与 AI 的交互正在越来越接近自然对话。今天的 LLM 不再只是回答问题的工具,也越来越多地出现在教育、客服、陪伴、心理健康等高度依赖情绪理解的场景中。

来自主题: AI技术研报
6278 点击    2026-05-12 14:31
动手搭建 AI 硬件设计平台!本地 LLM 一句话生成完整 Arduino 项目(接线图 + BOM + 代码 + 步骤)

动手搭建 AI 硬件设计平台!本地 LLM 一句话生成完整 Arduino 项目(接线图 + BOM + 代码 + 步骤)

动手搭建 AI 硬件设计平台!本地 LLM 一句话生成完整 Arduino 项目(接线图 + BOM + 代码 + 步骤)

大家好,最近有人刚刚为电子产品开发了一个 Claude Code 工具。 它叫做 Blueprint。输入你想要构建的内容,它就会为你的 Arduino 或树莓派项目生成接线图、物料清单和分步组装指南。能不能自己搭建一个呢?

来自主题: AI资讯
8790 点击    2026-05-10 12:50
Anthropic最新论文撬开大模型黑箱:隐藏动机发现率提升 4 倍以上

Anthropic最新论文撬开大模型黑箱:隐藏动机发现率提升 4 倍以上

Anthropic最新论文撬开大模型黑箱:隐藏动机发现率提升 4 倍以上

刚刚,Anthropic 发布论文《Natural Language Autoencoders Produce Unsupervised Explanations of LLM Activations》,试图用一套 自然语言自动编码器(Natural Language Autoencoders,下文简称 NLA), 撬开这个黑箱。

来自主题: AI技术研报
9000 点击    2026-05-08 14:33
号称1200万token上下文的模型来了,数据亮眼但疑点重重

号称1200万token上下文的模型来了,数据亮眼但疑点重重

号称1200万token上下文的模型来了,数据亮眼但疑点重重

当地时间 5 月 5 日,迈阿密一家名为 Subquadratic 的公司走出隐身模式。CTO Alexander Whedon 在 X 上把首款模型 SubQ 称作“a major breakthrough in LLM intelligence”(LLM 智能领域的重大突破),

来自主题: AI资讯
7221 点击    2026-05-07 12:02